Phần mềm và máy móc Wikipedia

Wikipedia được từ 10.000 đến 35.000 yêu cầu trang mỗi giây, tùy theo thời gian.[32] Hơn 100 máy chủ được thiết lập để thỏa mãn nhu cầu.

Wikipedia dựa trên MediaWiki, nền phần mềm wiki chuyên biệt có nguồn tự domở, phần lớn được viết trong PHP và được xây trên cơ sở dữ liệu MySQL. Phần mềm này bao gồm những tính năng lập trình như là ngôn ngữ macro, biến số, hệ thống gắn tiêu bản (template transclusion), và đổi hướng URL. MediaWiki được phát hành theo Giấy phép Công cộng GNU (GPL) và được sử dụng bởi các dự án Wikimedia, cũng như nhiều dự án wiki khác. Ban đầu Wikipedia chạy trên UseModWiki, một chương trình Perl của Clifford Adams (Phase I). Nó bắt phải viết hoa theo kiểu CamelCase để tạo ra siêu liên kết giữa các bài; cú pháp hai dấu ngoặc vuông được hỗ trợ về sau. Bắt đầu từ tháng 1 năm 2002 (Phase II), Wikipedia bắt đầu sử dụng chương trình PHP wiki với cơ sở dữ liệu MySQL; phần mềm này được viết đặc biệt cho Wikipedia bởi Magnus Manske. Phần mềm Phase II được sửa nhiều lần để thỏa mãn nhu cầu đang lên theo đường lũy thừa (exponential growth). Tháng 7 năm 2002 (Phase III), Wikipedia đổi qua phần mềm thế hệ thứ ba, MediaWiki, mới đầu do Lee Daniel Crocker viết.

Các máy chủ của Wikipedia trên toàn thế giớiTóm lược cấu trúc hệ thống vào tháng 4 năm 2009. Xem biểu đồ máy chủ tại Meta-Wiki.

Wikipedia chạy trên các nhóm máy chủ Linux tại Florida và hai vị trí khác.[33] Wikipedia chỉ xài một máy chủ cho đến năm 2004; lúc đó hệ thống máy chủ được mở rộng thành cấu trúc đa tầng (multitier architecture) phân phối. Vào tháng 1 năm 2005, dự án chạy trên 39 máy chủ dành riêng ở Florida. Hình dạng này bao gồm một máy cơ sở dữ liệu chủ chạy MySQL, vài máy phụ CSDL, 21 máy chủ web chạy Apache HTTP Server, và bảy máy bộ nhớ Squid. Vào tháng 9 năm 2005, nhóm máy chủ này đã bao gồm 100 máy tại ba vị trí chung quanh thế giới[33].

Các yêu cầu trang được gửi cho tầng máy Squid trước. Những yêu cầu mà bộ nhớ Squid không thể thỏa mãn được gửi qua các máy chủ cân bằng tải (load-balancing server) có phần mềm Linux Virtual Server; nó gửi yêu cầu cho một trong những máy chủ Apache để kết xuất trang dùng dữ liệu từ CSDL. Các máy chủ web gửi lại những trang được yêu cầu và kết xuất trang của các phiên bản ngôn ngữ Wikipedia. Để tăng lên tốc độ trả lời nhiều hơn, các trang được kết xuất cho người chưa đăng nhập được bỏ vào bộ nhớ phân phối (distributed memory cache) cho đến khi nó lỗi thời, nên có thể bỏ qua hẳn quá trình kết xuất trang đối với phần nhiều lần truy cập những trang thường gặp. Hai nhóm máy chủ lớn hơn tại Hà LanHàn Quốc hiện xử lý nhiều nhu cầu cho Wikipedia.

Tài liệu tham khảo

WikiPedia: Wikipedia http://www.alexa.com/siteinfo/wikipedia.org http://www.bbc.com/news/10104946 http://www.comscore.com/Insights/Press_Releases/20... http://www.ecommercetimes.com/story/76351.html http://weblogs.hitwise.com/bill-tancer/2007/03/wik... http://www.nature.com/nature/journal/v438/n7070/fu... http://rogchap.com/2011/09/06/top-40-website-progr... http://www.signonsandiego.com/uniontrib/20041206/n... http://www.thehindubusinessline.com/ew/2005/12/05/... http://www.time.com/time/business/article/0,8599,1...